Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.01 vteřin. 
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (oponent) ; Karafiát, Martin (vedoucí práce)
The automatic speech recognition area has started to adopt end-to-end neural network solutions for creating speech recognizers. However, the data hunger nature of these types of systems allows for the creation of recognizers only for high-resource languages, such as English, Chinese or Spanish. In low-resource scenarios, some solutions which alleviate the data scarcity problem have to be developed. One of the most effective techniques for this is fine-tuning a pre-trained model. The problem with the existing approaches of fine-tuning is that the token set of target and source languages does usually differ. That is why previous multi-lingual transfer learning approaches required the output layer to be changed, or mixed tokens from different languages in the output layer, or use universal token sets, or have separate output layers per language. This is undesirable because the sharing across languages in this case latent and not controllable in the output space when the language-specific graphemes are disjoint. Therefore this work proposes to map the tokens to the common set before the beginning of the pre-training. The existing solution was a transliteration of the source language to the target one, the novel approach is romanization where the token set of the target language is romanized to match the English alphabet. Subsequently, the diacritics from the romanized hypotheses can be restored using an additional restoration model. This has the advantage of increasing sharing in the output grapheme space.
Římský vliv na germánský kmen Cherusků
Švitorková, Hana ; Kepartová, Jana (vedoucí práce) ; Zdichynec, Jan (oponent)
Tato bakalářská práce se zabývá římským vlivem na germánský kmen Cherusků v období od posledních dvou desetiletí 1. století př. Kr. do roku 90 po Kr. Práce si klade za cíl určit, do jaké míry byl kmen ovlivněn vztahem s Římem, jenž ve zkoumaném období několikrát nabyl přátelské i nepřátelské podoby. Práce nejprve podává ucelený přehled starověkých písemných a archeologických pramenů, dostupných informací o samotném kmeni a dějin římsko- cheruských vztahů. Druhá část se zabývá vlivem římského působení v Germánii na moc cheruských náčelníků a kmenové aristokracie. Zkoumány jsou vnitřní vztahy v kmeni ovlivněné římskými luxusními dary a finanční podporou cheruských aristokratů. Následující kapitola se zabývá romanizací náčelnických synů na příkladu Arminia a Flava, synů cheruského náčelníka Segimera. Poslední část se věnuje družinám náčelníků, cheruskému působení v auxiliích římské armády, germánské osobní stráži císařů julsko-klaudijské dynastie (tzv. Germani corporis custodes) a vlivu Říma na germánské válečnictví. Při řešení byla použita zejména analýza primárních a sekundárních pramenů. Provedeným výzkumem bylo zjištěno, že římská říše měla nesmírný vliv na společenské, kulturní i vojenské aspekty života kmene Cherusků. Moc náčelníků kmene a aristokracie byla silně ovlivněna vnitřními spory, jež...
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (oponent) ; Karafiát, Martin (vedoucí práce)
The automatic speech recognition area has started to adopt end-to-end neural network solutions for creating speech recognizers. However, the data hunger nature of these types of systems allows for the creation of recognizers only for high-resource languages, such as English, Chinese or Spanish. In low-resource scenarios, some solutions which alleviate the data scarcity problem have to be developed. One of the most effective techniques for this is fine-tuning a pre-trained model. The problem with the existing approaches of fine-tuning is that the token set of target and source languages does usually differ. That is why previous multi-lingual transfer learning approaches required the output layer to be changed, or mixed tokens from different languages in the output layer, or use universal token sets, or have separate output layers per language. This is undesirable because the sharing across languages in this case latent and not controllable in the output space when the language-specific graphemes are disjoint. Therefore this work proposes to map the tokens to the common set before the beginning of the pre-training. The existing solution was a transliteration of the source language to the target one, the novel approach is romanization where the token set of the target language is romanized to match the English alphabet. Subsequently, the diacritics from the romanized hypotheses can be restored using an additional restoration model. This has the advantage of increasing sharing in the output grapheme space.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.